智能论文笔记

EuclidNets: An Alternative Operation for Efficient Inference of Deep Learning Models

Xinlin Li , Mariana Parazeres , Adam Oberman , Alireza Ghaffari , Masoud Asgharian , Vahid Partovi Nia

分类：机器学习

2022-12-22

With the advent of deep learning application on edge devices, researchers actively try to optimize their deployments on low-power and restricted memory devices. There are established compression method such as quantization, pruning, and architecture search that leverage commodity hardware. Apart from conventional compression algorithms, one may redesign the operations of deep learning models that lead to more efficient implementation. To this end, we propose EuclidNet, a compression method, designed to be implemented on hardware which replaces multiplication, $xw$, with Euclidean distance $(x-w)^2$. We show that EuclidNet is aligned with matrix multiplication and it can be used as a measure of similarity in case of convolutional layers. Furthermore, we show that under various transformations and noise scenarios, EuclidNet exhibits the same performance compared to the deep learning models designed with multiplication operations.

translated by 谷歌翻译

Electronic-structure properties from atom-centered predictions of the electron density

Andrea Grisafi , Alan M. Lewis , Mariana Rossi , Michele Ceriotti

分类： (统计)机器学习

2022-06-28

分子或材料的电子密度最近作为机器学习模型的目标数量受到了主要关注。一种自然选择，用于构建可传递可转移和线性缩放预测的模型是使用类似于通常用于密度拟合近似值的常规使用的原子基础来表示标量场。但是，基础的非正交性对学习练习构成了挑战，因为它需要立即考虑所有原子密度成分。我们设计了一种基于梯度的方法，可以直接在优化且高度稀疏的特征空间中最大程度地减少回归问题的损失函数。这样，我们克服了与采用以原子为中心的模型相关的限制，以在任意复杂的数据集上学习电子密度，从而获得极为准确的预测。增强的框架已在32个液体水的32个周期细胞上进行测试，具有足够的复杂性，需要在准确性和计算效率之间取得最佳平衡。我们表明，从预测的密度开始，可以执行单个Kohn-Sham对角度步骤，以访问总能量组件，而总能量组件仅针对参考密度函数计算，而误差仅为0.1 MEV/ATOM。最后，我们测试了高度异构QM9基准数据集的方法，这表明训练数据的一小部分足以在化学精度内得出地面总能量。

translated by 谷歌翻译

Building an Endangered Language Resource in the Classroom: Universal Dependencies for Kakataibo

Roberto Zariquiey , Claudia Alvarado , Ximena Echevarria , Luisa Gomez , Rosa Gonzales , Mariana Illescas , Sabina Oporto , Frederic Blum , Arturo Oncevay , Javier Vera

分类：自然语言处理

2022-06-21

在本文中，我们推出了一种新的通用依赖树木库，用于亚马逊尼亚的一种濒危语言：秘鲁在秘鲁说的Panoan语言Kakataibo。我们首先讨论实施的协作方法，事实证明，在本科生的计算语言课程的背景下创建树库有效。然后，我们描述了树库的一般细节以及针对拟议的注释实施的特定于语言的注意事项。我们最终对词性标记和句法依赖性解析进行了一些实验。我们专注于单语和转移学习设置，在这里我们研究了另一种Panoan语言资源的Shipibo-Konibo Treebos的影响。

translated by 谷歌翻译

Local overlap reduction procedure for dynamic ensemble selection

Mariana A. Souza , Robert Sabourin , George D. C. Cavalcanti , Rafael M. O. Cruz

分类：机器学习

2022-06-16

阶级失衡是一种以使学习对分类模型更具挑战性的特征，因为它们可能最终会偏向多数级别。在不平衡学习的背景下，基于整体的方法中的一种有希望的方法是动态选择（DS）。 DS技术根据整体中的分类器的一个子集，根据其在查询周围区域中的估计能力标记每个给定的样本。由于在选择方案中只考虑了一个小区域，因此全球类别不成比例可能对系统的性能产生较小的影响。但是，本地类重叠的存在可能会严重阻碍DS技术的性能，而不是分布不平衡，因为它不仅加剧了代表不足的影响，而且还引入了能力估计过程中模棱两可且可能不可靠的样本。因此，在这项工作中，我们提出了一种DS技术，该技术试图最大程度地减少分类器选择过程中本地类别重叠的影响。所提出的方法迭代从目标区域中删除了实例被认为是最难分类的实例，直到分类器被认为有能力标记查询样品为止。使用实例硬度度量量化本地类重叠的实例硬度度量来表征已知样品。实验结果表明，该提出的技术可以显着胜过基线以及其他几种DS技术，这表明其适合处理类别不足的班级和重叠的适用性。此外，当使用标记的集合的重新采样，重叠版本较少的版本时，该技术仍会产生竞争结果，特别是在重叠区域中少数少数族类样本的问题上。可在https://github.com/marianaasouza/lords上找到代码。

translated by 谷歌翻译

A Data-Driven Biophysical Computational Model of Parkinson's Disease based on Marmoset Monkeys

Caetano M. Ranieri , Jhielson M. Pimentel , Marcelo R. Romano , Leonardo A. Elias , Roseli A. F. Romero , Michael A. Lones , Mariana F. P. Araujo , Patricia A. Vargas , Renan C. Moioli

分类：人工智能

2021-07-27

在这项工作中，我们提出了一种基于从Marmoset猴的大脑收集的局部场潜在数据，提出了与帕金森病相关的新生物物理计算模型。帕金森病是一种神经退行性疾病，与大量NIGRA PARSCACTCA的多巴胺能神经元的死亡有关，这影响了大脑基底神经节 - 丘脑 - 皮质神经元电路的正常动态。尽管存在多种疾病的机制，但仍然缺少这些机制和分子发病机制的完整描述，仍然没有治愈。为了解决这种差距，已经提出了类似于动物模型中发现的神经生物学方面的计算模型。在我们的模型中，我们执行了一种数据驱动方法，其中使用差分演变优化了一组生物学限制参数。进化模型成功地类似于来自健康和Parkinsonian Marmoset脑数据的单神经元均值射击和局部场势的光谱签名。据我们所知，这是帕金森病的第一个基于来自Marmoset Monkeys的七个脑区域的同时电生理学记录的第一个计算模型。结果表明，该拟议的模型可以促进PD机制的调查，并支持可以表明新疗法的技术的发展。它还可以应用于其他计算神经科学问题，其中可以使用生物数据来适应大规模模型的脑电路。

translated by 谷歌翻译

Conjunction Data Messages behave as a Poisson Process

Francisco Caldas , Claudia Soares , Cláudia Nunes , Marta Guimarães , Mariana Filipe , Rodrigo Ventura

分类：机器学习

2021-05-14

空间碎片是太空勘探中的一个主要问题。国际机构不断监控大量的轨道对象数据库，并以结合数据消息的形式发出警告。卫星运营商的一个重要问题是估计新信息将到达，以便他们可以及时反应，但避免卫星演习。我们提出了一个统计学习模型的消息到达过程，允许我们回答两个重要问题：（1）下一个指定的时间间隔有任何新的消息吗？（2）下一条消息到达的不确定性何时到达？我们的贝叶斯泊松过程模型的问题（2）的平均预测误差小于在50K关闭遇到事件的测试集中超过4小时的基线。

translated by 谷歌翻译

Causal Networks and Freedom of Choice in Bell's Theorem

Rafael Chaves , George Moreno , Emanuele Polino , Davide Poderini , Iris Agresti , Alessia Suprano , Mariana R. Barros , Gonzalo Carvacho , Elie Wolfe , Askery Canabarro

分类： (统计)机器学习

2021-05-12

贝尔的定理通常被理解为量子理论与局部隐藏变量模型不兼容的证据。更一般地说，我们可以看到违反贝尔不等式，以证明与古典因果模型解释量子相关性的不可能性。然而，违反了贝尔不等式并不排除允许某些测量依赖性的经典模型，即，观察者所做的选择可以与生成要测量的系统的源相关联。在这里，我们表明，如果我们在网络内安排响铃测试，则可以定量上限测量依赖性。此外，我们还证明了这些结果可以调整，以便为大类因果网络获得非线性响铃不等式，并识别违反它们的量子可实现的相关性。

translated by 谷歌翻译

Advances and Open Problems in Federated Learning

Peter Kairouz , H. Brendan McMahan , Brendan Avent , Aurélien Bellet , Mehdi Bennis , Arjun Nitin Bhagoji , Kallista Bonawitz , Zachary Charles , Graham Cormode , Rachel Cummings

分类：

2019-12-10

Federated learning (FL) is a machine learning setting where many clients (e.g. mobile devices or whole organizations) collaboratively train a model under the orchestration of a central server (e.g. service provider), while keeping the training data decentralized. FL embodies the principles of focused data collection and minimization, and can mitigate many of the systemic privacy risks and costs resulting from traditional, centralized machine learning and data science approaches. Motivated by the explosive growth in FL research, this paper discusses recent advances and presents an extensive collection of open problems and challenges.

translated by 谷歌翻译